import numpy as np
import pandas as pd

brand_file_path = '../../data/raw data/餐饮连锁品牌数据.xlsx'
cater_file_path = '../../data/raw data/餐饮连锁数据.xlsx'
sheet_names=['门店信息','菜品信息','营销记录','顾客评价']
sheet_name=sheet_names[1]
df_dish = pd.read_excel(cater_file_path, sheet_name)

print("\n【空值统计】")
print(df_dish.isnull().sum())
print("======================")
# --- 测试1：查看哪些列空值最多 ---
missing_rate = df_dish.isnull().mean().sort_values(ascending=False)
print("\n【空值比例（Top 10）】")
print(missing_rate.head(10))
print("======================")
# --- 处理方式：删除含有空值的行 ---
before_rows = df_dish.shape[0]# 记录删除前的行数
df_dish.dropna(inplace=True)# 删除包含空值的行
after_rows = df_dish.shape[0]# 记录删除后的行数
print(f"\n【空值处理】已删除 {before_rows - after_rows} 行包含空值的数据。")

# --- 验证：是否还有空值 ---
print("\n【空值处理后验证】")
print(df_dish.isnull().sum().sum())  # 0 表示处理完毕
print('======================')
print('======================')

